@ARTICLE{26583204_510536041_2021, author = {В. Н. Кузьмин and А. Б. Менисов}, keywords = {, защита информации, парирование угроз информационной безопасности, конфиденциальные данные, персональные данные, машинное обучение, глубокое обучениевыявление сущностей текстов естественного языка}, title = {

Методический подход к выявлению угрозы извлечения конфиденциальных данных из автоматизированных систем управления на базе интернет-технологий

}, journal = {Бизнес-информатика}, year = {2021}, number = {3 Vol.15}, pages = {35-47}, url = {https://bijournal.hse.ru/2021--3 Vol.15/510536041.html}, publisher = {}, abstract = {      В современных условиях всеохватывающей глобальной цифровизации стремительно растет и развивается киберпреступность. Поэтому обеспечение информационной безопасности относят к стратегическим целям развития информационного общества в России. Однако вопрос о том, как должно быть достигнуто «состояние защищенности личности, общества и государства от внутренних и внешних информационных угроз» в соответствии с содержанием и требованиями программ «Информационная безопасность» и «Цифровая экономика России 2024», остается открытым. Целью исследования, некоторые результаты которого представлены в настоящей публикации, является повышение эффективности выявления угроз извлечения конфиденциальных данных из автоматизированных систем управления с html-страниц для снижения риска использования этих данных на подготовительных и начальных этапах организации атак на информационную инфраструктуру государственных и коммерческих организаций. В статье описан разработанный подход к выявлению сущностей конфиденциальных данных, основанный на объединении нескольких нейросетевых технологий - универсального кодировщика предложений и нейросетевой рекуррентной архитектуры двунаправленной долгой краткосрочной памяти. Результаты оценивания показателей эффективности в сравнении с современным инструментарием обработки текстов естественного языка (spaCy) показали достоинства и перспективы практического применения данного методического подхода.}, annote = {      В современных условиях всеохватывающей глобальной цифровизации стремительно растет и развивается киберпреступность. Поэтому обеспечение информационной безопасности относят к стратегическим целям развития информационного общества в России. Однако вопрос о том, как должно быть достигнуто «состояние защищенности личности, общества и государства от внутренних и внешних информационных угроз» в соответствии с содержанием и требованиями программ «Информационная безопасность» и «Цифровая экономика России 2024», остается открытым. Целью исследования, некоторые результаты которого представлены в настоящей публикации, является повышение эффективности выявления угроз извлечения конфиденциальных данных из автоматизированных систем управления с html-страниц для снижения риска использования этих данных на подготовительных и начальных этапах организации атак на информационную инфраструктуру государственных и коммерческих организаций. В статье описан разработанный подход к выявлению сущностей конфиденциальных данных, основанный на объединении нескольких нейросетевых технологий - универсального кодировщика предложений и нейросетевой рекуррентной архитектуры двунаправленной долгой краткосрочной памяти. Результаты оценивания показателей эффективности в сравнении с современным инструментарием обработки текстов естественного языка (spaCy) показали достоинства и перспективы практического применения данного методического подхода.} }